人工智能与未来教育前沿研究|杨海燕 李涛:ChatGPT教学应用:场景、局限与突破策略
引用格式
杨海燕 李涛.ChatGPT教学应用:场景、局限与突破策略[J].中国教育信息化,2023,29(6):026-034.DOI:10.3969/j.issn.1673-8454.2023.06.004
人工智能与未来教育前沿研究
ChatGPT教学应用:场景、局限与突破策略
杨海燕 李 涛
摘 要: ChatGPT作为基于大语言模型的人工智能对话系统,在给人类教育应用带来变革的同时,也对教育提出了新挑战。ChatGPT模型综合应用人工智能领域的改进Transformer神经网络GPT模型、基于人类反馈的强化学习、指令微调与思维链等技术,实现了语言解析、情境关联、文本生成等功能。在教学场景中,ChatGPT能够辅助教、学、评升级应用,给教学准备与开展、学习内容与方法、评价内容与方式都带来了新的应用可能。但ChatGPT仍存在答案真实性难以保证、算法隐藏文化偏见等问题,可能生成新型学习权威、弱化人类学习能力、挑战教育本质。因此,面对这一异质的人工智能媒介,需在做好风险防范的基础上,发挥其“代具”功能,让教师善用工具、促进全人涵养,学生学会批判、增强数字素养,社会则积极鼓励,构建教—机—学良好教育生态,以促进ChatGPT在教学中的广泛应用。
关键词: ChatGPT;生成式人工智能;教学应用;教学评价;教育数字化中图分类号: G434文献标志码: A文章编号: 1673-8454(2023)06-0026-09作者简介: 杨海燕,同济大学第一附属中学教师,硕士(上海 200438);李涛,同济大学土木工程学院博士研究生(上海 200092)2022年11月30日,美国OpenAI公司发布了新一代基于大型语言模型(Large Language Model, LLM)的人工智能对话系统ChatGPT,引起国际专业学者广泛关注[1]。ChatGPT是一款人工智能技术驱动的自然语言处理工具,通过海量数据存储和高效设计架构理解和解读用户请求,以近乎人类自然语言的方式生成具有“较高复杂度的回应文本”,甚至能完成撰写视频脚本、文案、机器翻译、分类、代码生成、对话AI等任务[2]。作为一种突破性人工智能产品,ChatGPT凭借其强大的“对话式”语言交互能力与广泛的知识库,展现了生成式人工智能(AI Generated Content, AIGC)技术在教育、软件开发等传统高知识背景领域的巨大潜力。与此同时,ChatGPT直接挑战了语言交流、推理与内容生成等人类引以为傲的独特能力,引发了学者对人工智能“入侵”教育教学的担忧。
国内外学者对ChatGPT在教育领域的应用及冲击进行了前瞻性探讨。部分学者将其视为一种教育教学工具,积极探索其在未来教育中的存在方式。例如,卢宇探究了ChatGPT在教师教学、学习过程、教育评价、学业辅导四个方面的潜在教育应用[3];陈增照等探讨了教师对ChatGPT的应用策略,认为“应探索人工智能助推教师管理优化、教师教育改革,进一步挖掘和发挥教师在人工智能与教育融合中的作用”[4]。这些学者多着眼于ChatGPT的工具属性,认为“教育的未来取决于教师现在如何使用ChatGPT”[5]。 另一些学者则从新技术对教育本身的影响出发,关注ChatGPT所带来的技术与伦理冲击,认为其将重塑教育内容和教育形式。例如,吴砥等认为,ChatGPT将带来教育形态的更替和伦理安全风险[6];郑世林等认为,ChatGPT将对现有教育方式、授课内容和教育体制改革方向进行重塑[2]。刘永谋认为,以ChatGPT为代表的AIGC技术生成的内容在文科教育领域会越来越多,可能会对文科教育产生颠覆性影响,甚至重塑文科教育[7]。看到冲击的同时,学者们也提出了较多的防范策略。例如,王佑镁等认为,应该共建教育人工智能伦理规范,促进教育人工智能理性发展[8]。然而,当前研究少有结合ChatGPT的技术特征,具体分析该技术对教学带来的机遇与挑战。本文将以ChatGPT技术特征为切入点,分析其在教学过程中的价值,从教育的三大环节——教、学、评入手,探究其作为一种异质媒介融入教学生态的应用场景。最后结合其局限性,探究以ChatGPT为代表的通用人工智能时代教育方式的应对之策。
一、ChatGPT技术特征
(一)ChatGPT技术解析ChatGPT是一种自然语言处理(Natural Language Processing, NLP)模型,主要应用了基于Transformer模型的GPT-3.5神经网络架构,以实现对广泛语料库的学习,并构建生成千亿级参数的大型语言模型。GPT-3.5架构基于人类反馈的强化学习、指令微调与思维链技术,逐步实现广泛领域对话式文本生成能力。基于最新升级版GPT-4架构的ChatGPT Plus更进一步实现了对图片、视频等非文本类半结构化数据的认知。
1.基于Transformer模型的GPT-3.5神经网络架构
ChatGPT对语料的学习采用一种基于自注意力机制的深度神经网络Transformer模型[3]。Transformer模型主要由编码器(Encoder)与解码器(Decoder)组成。编码器由多个结构一致的神经网络组成,每个网络都包含多头注意力以及前馈层,将输入文本编码为高维隐含语义向量。解码器在编码器模块的基础上,还包含一个额外的编解码多头注意力层,能够依据上一步编码的输出,解码隐含语义向量为当前步骤的输出向量[9]。Transformer模型通过一种非循环的网络结构,以一种并行的方式建立不同词符间的联系,缩短了训练时间,具备处理表征任意序列数据的能力[10]。
2.基于人类反馈的强化学习技术
ChatGPT采用的基于人类反馈的强化学习技术涉及三个核心步骤:预训练语言模型、训练奖励模型、用强化学习方式微调语言模型。
(1)预训练语言模型
ChatGPT生成内容能达到“有用、诚实和无害”的标准,且不会因为训练产生明显偏好。随后,通过人工少量标注数据的形式对预训练语言模型进行微调,得到有监督的微调(SFT)模型。这是一个初步优化的文本生成模型。
(2)训练奖励模型
训练奖励模型是使ChatGPT更接近人类表现的关键。在有监督的微调模型基础上,通过人工标注的方式,对SFT模型生成的多个结果进行人工排序标记,越符合人类表现的答案排序越靠前。模型生成更符合人类表现的答案时可获得更多奖励。
(3)用强化学习方式微调语言模型
ChatGPT采用近端策略优化(Proximal Policy Optimization, PPO)算法,结合训练奖励模型对文本生成模型进行评估,并利用强化学习的方式更新模型参数,提升其生成更符合人类期待答案的能力。
3.指令微调技术
指令微调技术是一种自然语言处理模型微调技术,主要功能是激发语言模型的理解能力,并帮助模型更好地执行各种任务。其原理是在模型的预训练过程中,预设特定任务的指令,让模型执行这些任务并建立训练数据。在微调阶段,模型可将自然语言处理相关任务转化为基于指令描述的文本生成问题,并将训练数据中的指令作为辅助信息,帮助模型更好地理解任务,产生更符合人类期待的输出。
4.思维链技术
思维链技术是指参考人类解决问题的方法,将一些复杂问题分解为中间问题,然后进行系列自然语言形式的推理,最后得出答案的技术。思维链技术提升了大型语言模型复杂推理能力的准确度。
(二)ChatGPT的核心能力及教育价值
结合世界知识语料,ChatGPT在广泛的学科领域具备优质的语言解析、情境关联、文本生成等能力,且GPT-4模型进一步拓展了对图片、视频等语料的解析能力,让其具备了类理解能力、类逻辑推理能力与类创造能力,在教育领域的应用价值进一步彰显。
1.语言解析
基于改进的Transformer结构,GPT-3.5与GPT-4模型构建了千亿级参数的大型语言模型,实现了非监督式语料上下文学习。ChatGPT对自然语言理解的准确度以及对用户意图的把握度方面,都具有明显的功能提升。此外,结合少量的提示词,ChatGPT能对通用领域知识进行回答,展现出比人类更高的综合运用效能,形成一种通用语言模型。因此,ChatGPT具备语料学习能力以及类理解能力,可以适用于教育领域语料的快速学习,以及更加广泛场景的教学资料准备。
2.情境关联
基于人类反馈的强化学习技术与指令微调技术,让ChatGPT具有记忆历史对话的能力,在新的回答中能够关联已有对话进行答案验证或完善,从而形成针对用户唯一的使用场景,满足人们对相关问题的追问,生成较符合人类期待的答案。ChatGPT已初步具备简单逻辑推理能力,能够对因果、数学计算等逻辑问题给出解答。更广泛的通用问题推理与解析能力,使其在教育领域可实现资料快速关联、分析,服务知识检索、评价反馈等需求。
3.文本生成
Transformer模型、基于人类反馈的强化学习、指令微调、思维链等技术的综合运用,让ChatGPT具备了目前最强大的通用领域文本生成能力,主要体现在:①以切合提问的形式,提供面向通用领域的回答。②具备一定的综合概述能力,能够为用户提供整理后的答案,而非简单罗列检索。③高质量的翻译、错误检查以及文本创造能力。ChatGPT具备类创造能力,能够生成信息量大、较优质的内容,可辅助教育教学各环节的内容产出。此外,它还具备生成论文、代码、小说等强知识相关性创作场景下的文本生成能力。
二、ChatGPT教学应用的场景
ChatGPT强大的语言解析、情境关联、文本生成能力,其在教、学、评等文本处理与生成领域具备广泛的辅助能力与应用价值。ChatGPT教学应用场景及其技术基础如图1所示。三、ChatGPT教学应用的局限
ChatGPT在给教学带来新应用场景与变革的同时,也存在较多局限,加剧了新技术对教育的挑战。 (一)答案真实性难以保证 ChatGPT更多的是依赖既有语料的上下文语义,本质上是对既有语料的重新加工与组织,适用于有组织地回复某一类问题,在复杂逻辑推理与新内容生成方面的表现欠佳,目前该技术仅对政策合规性进行检查,导致答案质量及真实性难以保证。产生以上问题的主要原因包括:一是语料库依赖。并不是所有的教育资源语料都对ChatGPT开放,既有语料库资源范围及数据质量在一定程度上限制了答案生成质量,可能导致回答结果的内容深度和覆盖范围难以满足要求。二是提示词依赖。由于ChatGPT基于对提示词及其逻辑关系的匹配来生成答案,因此提示词不同可能会产生完全不同的结果,严重依赖提问者能力和提问方式。三是缺乏逻辑推理能力。模型根据用户使用不断更新,因此输出答案稳定性不足,无法作为恒定评判。因此,针对内容稳定性要求较高的教育领域,ChatGPT有时是无所不知的智者,但有时可能只是一个一无所知的婴儿,其回答的正确性需批判看待。 (二)算法隐藏文化偏见 ChatGPT主要依赖英文语料及少部分外语资料进行预训练,而语言与文化、思维、习俗、环境等息息相关,在语言转化过程中存在信息的再加工。因此,ChatGPT带来的价值观、文化认识、语言学习冲击是否会导致文化入侵、稀有文化的消失等问题仍有待考量。ChatGPT根据训练人员的提示给出答案,训练人员对这些答案进行排序,训练出一个奖励模型,后续训练采用更加广泛的语料、提示词给出答案,利用奖励模型作为约束来不断促使ChatGPT给出符合预期(奖励模型作为评判标准)的答案。在这个过程中,奖励模型、语料以及模型本身的重要程度无法区分,且这个过程无法体现不同价值观念、知识背景、个性喜好用户的个性化需求。此外,由于奖励模型的存在,ChatGPT的答案是本质上基于喜好,而非逻辑与知识的正确与否,进一步加剧了人们对该模式隐藏价值观的担忧。 (三)生成新型学习权威 ChatGPT强大的功能在便捷知识获取、陪伴学生学习的同时,也助长了新权威的出现。一是全盘接受ChatGPT提供的信息,缺乏求证与人类审查。当ChatGPT提供的内容与教师提供的信息产生冲突时,人类可能会更倾向认同人工智能。二是接受ChatGPT的隐性诱导。ChatGPT具有初步的道德判断能力,当人类提问触及某些不合法合规的问题时,ChatGPT会拒绝回答。而由于伦理的学习成本巨大,一旦ChatGPT在语料库中受到“伦理的污染”或“投毒”,其重新认知新的伦理判断需要一个很长的过程[2]。在未更新模型伦理偏差前,由于认知偏差,绝大多数人难以判别生成的答案中隐蔽的错误信息,ChatGPT很有可能凭借其诱导能力颠覆人类的价值观。三是ChatGPT作为闭源模型,技术细节无法接受公众监督。当前算力以及训练成本高昂,算力、语料与算法导致模型的中心化,ChatGPT能否像传统搜索引擎与知识库一样提供更加广泛的教育服务还有待商榷。 (四)弱化人类学习能力 教育的核心是希望学生通过特定内容的学习,掌握理解认知、思维辩证、逻辑推理等能力。但ChatGPT以隐去过程的形式快捷地呈现答案,让学生直接跳过了思维锻炼的过程,长此以往,学生可能对技术形成依赖,养成惰性思维,丧失独立思考能力。同时,由于模型使用语料库的限制,ChatGPT采用人工反馈的强化学习方法,根据训练数据、提示词(问题)中的语言统计关系来生成回答,一般答案相对简单、或者包含较为浅显的问题,甚至会生成一些看起来正确,但是完全错误或者无意义的答案[17]。特别是在参考文献检索时,会生成完全不存在的内容与文献[18]。频繁汲取平庸甚至错误的信息,会导致个体思维的固化和知识价值取向的扭曲。另外,ChatGPT目前主要基于已有语料重新组合生成答案,无法真正创新创造,在限制使用者思维的同时,会将这种停滞扩大到更多的用户层面,从而造成人类整体思想深度的降低,在人工智能越发智能化的同时,让人类大脑变得弱智化。 (五)挑战教育本质教育本质上是一种“人际关系”。教育是通过主体间的文化交往建构精神契合的活动,知识的传承是一项任务而非全部。教育的全部内核在于通过师生互动习得成体系的知识以及立身处世的法则,即社会生存的必要能力。当学习者倾向相信人工智能时,就意味着放弃了对鲜活人际关系的信任,将人局限于“人—机”关系维度上,凭借ChatGPT有问必答的虚假陪伴与需求满足,限制了人与社会的生动联系,让个体学习缺乏教师言传身授、缺乏身边的榜样与支撑连接,难以培养出一个人格完善的社会人,更难以安顿自己的心灵、建构意义的世界。
四、ChatGPT教学应用的突破策略
法国当代著名哲学家贝尔纳·斯蒂格勒(Bernard Stiegler)曾在《技术与时间》一文中重新分析了技术与人的存在问题,并将人的存在建构在技术之上,提出了“代具性”思想。尽管ChatGPT对传统教育带来了一定冲击,但若将其视作一种新“代具”的出现,将会看到人类教育的新变革。只要以积极开放的心态寻找新技术应用之策,同时加快规范、监管等机制落地,便能在加强相关风险控制的同时,让技术更好地赋能人类。
(一)教师:善用工具,促进全人涵养 掌握新兴技术并使之服务教学是双新背景下教师的一项必备技能,在数字化赋能教学等要求的驱动下,教师应该以更加积极的心态面对ChatGPT。 首先,坚持教育根本,树立育人信心。教育的本质在于人与人的交往与影响,是一个灵魂唤醒另一个灵魂的交互,ChatGPT并不能提供精神成长的引导。因此,教师要坚信自己言传身教对学生的教育意义,坚持用饱满的人格影响学生的成长。 其次,转变育人理念与育人方法。ChatGPT的出现确实对学生的学习状态产生了一定影响。作业答案寻找、论文抄袭代写等违背教育精神的状况时有发生。对此,教师需转变育人理念与方法,更加注重学生思维的提升训练、情感的学习感受以及意志品质的培养等。 最后,坚持技术向善,服务教育教学。将ChatGPT作为教育的“代具”,让其成为像黑板、电脑一样辅助教学的手段,助力新一代教学转型。例如,教师可积极拥抱新技术,使用人机协同提高备课效率,将时间花费在人工智能不能回答或无法提供帮助的部分,挖掘智能时代的育人新契机,让ChatGPT等人工智能工具更好地服务教学、服务学生的全人涵养。 (二)学生:学会批判,增强数字素养 首先,正确应用技术,避免技术依赖。尽管ChatGPT可以成为教育的“代具”,但并不能替代学习本身。作为学习者,要认识学习的根本在于学习能力的提升,而非答案的获取。因此,培养正确的技术态度和技术使用能力,以技术辅助学习而不是主导学习,是人工智能时代学习的要义。 其次,批判看待答案,发展创新思维。创新思维与批判思维是人类优于机器最大的特点,也是教育的关键目标。发展批判性思维,不仅可以帮助我们从ChatGPT提供的智能答案中提炼出真正有价值的信息,更是发挥人类主体性,并主动跳出人工智能茧房的关键。 最后,积极走入人群,寻求真实链接。人是群居性动物,是处于社会关系当中的社会人,这是人与人工智能本质的区别。ChatGPT能提供给人类看似有效的回应,但都是基于算法的话术,并不能真正理解人类的情感。因此,真正的学习还是需要走入真实的人群,寻求广泛的社会支持和社会联系,拒绝困于技术设置的牢笼。 (三)社会:积极鼓励,构建教—机—学良好生态 一方面,落地应用场景案例,引导技术正确使用。在ChatGPT发展应用的起始阶段,相关部门应积极投入、引领示范,实现从起步、应用和融合数字技术的落地示范场景,为学生、教师、学校提供应用范例。营造教育领域树立数字化意识和思维、培养数字化能力和方法的氛围,激发人工智能资源和数据要素服务教育创新和发展。 另一方面,规范监督监管机制,防范人工智能危害。面对人工智能的潜在风险,相关部门或可推进制定相关法律法规,构建智慧教育发展生态,形成数字治理体系和机制,在保障新一代人工智能工具落地应用的同时,守住伦理与法律边界,让技术与教育双螺旋式互促共进。五、结语
ChatGPT作为一种大语言处理模型,在给人类教育带来变革的同时,也对教育应用提出了新的挑战。从传统的教、学、评三大教育环节看,ChatGPT可以辅助更多教学应用的落地;可以协助教师优化备课效率、提高课堂互动,辅助构建智慧化教育场景;可以解放知识内容,鼓励对话式学习,促进学习内容、模式的变革,提升学习能效;可以变革教师教学评价和学生学习评价模式,为改进教师的教学行为与学生的学习行为提供高效能的反馈信息。但是,受限于现有技术和模型,ChatGPT仍存在较多局限,可能会对教育领域带来一定冲击,存在答案真实性难以保证、算法隐藏文化偏见,可能面临生成新型学习权威、弱化人类学习能力、挑战教育本质等挑战。面对ChatGPT带来的机遇与挑战,将其作为一种教育新“代具”,辅助教育是较好的应对之策。教师应善用工具、促进全人涵养,学生应学会批判、增强数字素养,社会应积极鼓励,构建教—机—学良好教育生态。总之,要积极拥抱、理性应对人工智能技术,让其更好地为教育所用、为人类所用。
参考文献:
[1]Tools such as ChatGPT threaten transparent science; here are our ground rules for their use[J]. Nature, 2023,613(7945):612.
[2]郑世林,姚守宇,王春峰.ChatGPT新一代人工智能技术发展的经济和社会影响[J/OL].产业经济评论:1-20[2023-03-25].https://doi.org/10.19313/j.cnki.cn10-1223/f.20230310.002.
[3]卢宇,余京蕾,陈鹏鹤,等.生成式人工智能的教育应用与展望——以ChatGPT系统为例[J/OL].中国远程教育:1-9[2023-03-25].https://doi.org/10.13541/j.cnki.chinade.20230301.001.
[4]陈增照,石雅文,王梦珂.人工智能助推教育变革的现实图景——教师对ChatGPT的应对策略分析[J/OL].广西师范大学学报(哲学社会科学版):1-11[2023-03-25].http://kns.cnki.net/kcms/detail/45.1066.C.20230320.1347.002.html.
[5]海伦·克朗普顿,任冠虹.ChatGPT时代:教育如何创新[N].中国社会科学报,2023-03-06(08).
[6]吴砥,李环,陈旭.人工智能通用大模型教育应用影响探析[J].开放教育研究,2023,29(2):19-25,45.
[7]刘永谋.ChatGPT冲击与文科教育变革[N].中国社会科学报,2023-03-07(05).
[8]王佑镁,王旦,梁炜怡等.ChatGPT教育应用的伦理风险与规避进路[J].开放教育研究,2023,29(2):26-35.
[9]王辰成,杨麟儿,王莹莹,等.基于Transformer增强架构的中文语法纠错方法[J].中文信息学报,2020,34(6):106-114.
[10]田永林,王雨桐,王建功,等.视觉Transformer研究的关键问题:现状及展望[J].自动化学报,2022,48(4):957-979.
[11]李瑾瑜,赵文钊.“集体备课”:内涵、问题与变革策略[J].西北师大学报(社会科学版),2011,48(6):73-79.
[12]黄英杰.论实践教育哲学的教育信条[J].教育理论与实践,2017(31):11-15.
[13]曹树金,曹茹烨.从ChatGPT看生成式AI对情报学研究与实践的影响[J].现代情报,2023,43(4):3-10.
[14]FREIRE P. Pedagogy of the Oppressed[M]. New York: Seabury Press, 1970..
[15]焦建利.ChatGPT:学校教育的朋友?还是敌人?[J/OL].现代教育技术:1-11[2023-03-20].http://kns.cnki.net/kcms/detail/11.4525.n.20230316.1330.002.html.
[16]吴立宝,曹雅楠,曹一鸣.人工智能赋能课堂教学评价改革与技术实现的框架构建[J].中国电化教育,2021(5):94-101.
[17]THORP H H. ChatGPT is fun, but not an author[J]. Sci, 2023,379(6630):313.
[18]OWENS B. How Nature readers are using ChatGPT[J]. Nature, 2023,615(7950):20.Haiyan YANG1, Tao LI2
(1.First Affiliated Middle School of Tongji University, Shanghai 200438;
2.School of Civil Engineering, Tongji University, Shanghai 200092)
编辑:王晓明 校对:李晓萍
往期目录|超链接版
期刊简介
《中国教育信息化》创刊于1995年8月,是由中华人民共和国教育部主管,教育部教育管理信息中心主办,面向国内外公开发行的国家级学术期刊。期刊内容力求全面深入地记录我国教育信息化的建设进展、研究与应用成果和行业发展状况,开展我国教育信息化发展状况调研和教育信息化国际比较研究,服务于国家教育宏观决策;力求全面准确地把握教育信息化相关的方针政策和标准规范,及时追踪ICT前沿技术的发展趋势及其与教育的融合,深度挖掘教育信息化建设与应用的体制、机制创新,服务于我国教育信息化实践。
●RCCSE中国核心学术期刊
●中国人文社会科学(AMI)扩展期刊
●中国期刊全文数据库收录期刊
●中文科技期刊数据库收录期刊
●国家哲学社会科学学术期刊数据库收录期刊
●中国核心期刊(遴选)数据库收录期刊
●龙源期刊网收录期刊
一年12期,每月20日出版
20元 / 期,邮发代号:82-761
编辑部邮箱:mis@moe.edu.cn
通讯地址:北京市西城区华远北街2号921室